“线框”是一种基于线段的线段表示,旨在掌握周围的常规结构形状的人造场景的大规模视觉属性。与线框不同,传统的边缘或线段聚焦在所有可见边缘和线上,而不特别区别对人为结构信息更加突出。现有的线框检测模型依赖于监督注释数据但不明确地注意了解如何构成场景的结构形状。此外,我们经常面临许多前景对象,遮挡背景场景干扰它们背后的完整场景结构的适当推断。为了解决这些问题,我们首次在该领域中,提出新的条件数据生成和培训,帮助模型了解如何忽略孔所示的遮挡,例如在图像上屏蔽的前景对象区域。此外,我们首先将GaN结合在模型中,让模型更好地预测潜在的场景结构,即使超出大孔。我们还介绍了伪标签,以进一步扩大模型容量来克服小规模的标记数据。我们在定性和定量上展示我们的方法显着优于以前的工程无法处理孔,并且可以改善普通检测,没有给出孔。
translated by 谷歌翻译